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Resumen 

Para el cifrado de datos suele ser necesaria una llave como base, 
por lo que es indispensable tener una que sea robusta y confiable, para 
así evitar el acceso de terceros a la información cifrada. Esto requiere 
un generador de números pseudo-aleatorios que proporcionará dicha 
llave, por lo que se propone trabajar con autómatas celulares auxi- 
liándose con Mathematica, para revisar qué reglas, y a qué nivel, son 
pseudo-aleatorias. Este proyecto se centra en la revisión de posibles 
reglas pseudo-aleatorias, analizando sus características detalladamen- 
te y sometiéndolas a un conjunto de pruebas de aleatoriedad con el fin 
de conocer cuales de ellas nos permitirán obtener los números pseudo- 
aleatorios que conformarán la llave para el cifrado de datos. 

Keywords: autómatas celulares, pseudo-aleatoriedad, cifrado de 
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1. Introducción 



Esta investigación es parte complementaria de un proyecto que se está tra- 
bajando en la Universidad Politécnica de San Luis Potosí, en el que se pre- 
tende desarrollar un sistema de encriptación de datos basado en autómatas 
celulares. Como parte del proyecto inicial se debe comprobar que se está tra- 
bajando con reglas pseudo-aleatorias, ya que de comenzar a trabajar con 
reglas al azar se corre el riesgo de generar un cifrado que puede ser hacheado 
fácilmente. Por tanto, se buscan reglas de autómatas celulares que tengan un 
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comportamiento pseudo- aleatorio, para después generar secuencias con cada 
una y probar su aleatoriedad. 

2. Antecedentes 

Los autómatas celulares fueron inventados a fines de los años cuarenta 
por Stanislaw Ulam y John von Neumann, quienes realizaron trabajos para 
crear un sistema que se replicara a sí mismo a partir de una abstracción 
matemática. Años después, Wiener y Rosenblueth desarrollaron un modelo de 
autómatas celulares que pretendía describir matemáticamente la conducción 
de impulsos en sistemas cardiacos. En los sesentas se empezaron a estudiar 
como un tipo de sistemas dinámicos, y para los setenta aparece el Juego de 
la Vida. Este fue inventado por John Conway y consistía en una colección 
de celdas las cuales, basadas en reglas matemáticas, podían vivir, morir o 
mutiplicarse, todo esto dependiendo de las condiciones iniciales [6]. En 1983, 
Stephen Wolfram publicó algunos escritos sobre una clase de autómatas que 
el llamaba autómatas celulares elementales y sobre su comportamiento y las 
reglas que los definían. Para el 2002, Wolfram publicó su libro A New Kind 
of Science [10] en el cual explica ampliamente sobre ellos, su trabajo y su 
importancia en todas las ramas de la ciencia. En cuanto a la encriptación, 
Olu Lafe [5] nos explica que existen un numero de patentes dadas y literatura 
sobre ello que incluye los trabajos de Wolfram (1985) [9j, Delahaye[lj (1991), 
Guan [8] (1987) y Gutowitz [2] (1994). En los cuales, Wolfram hace uso de la 
regla 30 de los autómatas celulares para generar números pseudo-aleatorios; 
Guan usa un sistema dinámico invertible; Gutowitz (U.S. Patent 5,365,589) 
usa sistemas dinámicos irreversibles; y Lafe (U.S. Patent 5,677,956 el 14 
de octubre de 1997) utiliza operaciones simples de transformación, lo cual 
implica una enorme biblioteca de llaves o códigos criptográficos derivados de 
los autómatas celulares [H [2l |3]. 

3. Autómatas Celulares 

Un autómata celular, en su versión más simple, es una línea unidimen- 
sional de sitios o celdas, donde cada una es blanca o negra. El color o estado 
de esta celda puede cambiar conforme al tiempo. Con cada paso discreto de 
tiempo, las celdas se actualizan (ya sea para mantener o cambiar su color 
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previo) de acuerdo a la función de su estado anterior y al de las dos cel- 
das vecinas a ella (una por el lado izquierdo y otra por el lado derecho). 
Existen además, otros espacios disponibles de autómatas celulares, donde se 
consideran más parámetros como lo son el número de estados en las cel- 
das, vecindarios mayores, plantillas más amplias y dimensiones adicionales, 
colores, entre otros. 

3.1. Reglas 

A las condiciones de vecindad de un autómata celular se le conoce como 
"regla". Existen 256 (2^) reglas para los autómatas celulares con un estado 
binario variable (0,1) y una vecindad de 1 con longitud de tres. Cada una de 
ellas está especificada por un código decimal obtenido a partir de las ocho 
permutaciones para la vecindad 1 en orden descendiente y los leemos como 
un cdigo binario de ocho dígitos, lo cual nos da el número de la regla. La 
regla 30 , por ejemplo, está definida por la configuración dada en la figura 
1. Nótese que la secuencia 00011110 es la representación binaria del número 
30. 

111 110 101 loo 01 1 010 ooi mo 

\/ \/ \/ \/ \/ \/ \/ W 

1 1 110 

Figura 1: Representación binaria de la regla 30. 

Stephen Wolfram propone un esquema de clasificación, el cual divide las 
reglas de autómatas celulares en cuatro categorías de acuerdo a sus evolu- 
ciones a partir de una condición inicial "desordenada." aleatoria. La clase 
1, también conocida como de tipo fijo, la cual evoluciona rápidamente a un 
estado estable y homogéneo en el que todos los sitios tienen el mismo valor 
y cualquier aleatoriedad en el patrón inicial desaparece; la clase 2, también 
conocida como de tipo periódico, en la cual se repite un mismo patrón como 
un bucle donde su evolución es a gran velocidad y cualquier aleatoriedad en 
el patrón inicial solo dejaría restos que complementarían el bucle; la clase 
3, también conocida como de tipo caótico o pseudo- aleatorio, en donde su 
evolución conduce a un patrón caótico donde cualquier estructura estable es 
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rápidamente destruida por el ruido circundante y los cambios tienden a ex- 
tenderse de manera indefinida; y la clase 4, de tipo complejo, la cual presenta 
comportamientos tanto de la clase 2 y 3 y suelen presentar una evolución más 
lenta. Teniendo una condición inicial simple, existen 13 reglas de autómatas 
celulares en las clases 3 y 4 calculadas en ¡11], que son las siguientes: 30, 45, 
75, 79, 86, 89, 101, 110, 124, 135, 137, 149, 193. Éstas se amplían a 38 reglas 
de clase 3 si se tienen condiciones iniciales aleatorias ¡ü], las cuales son las 
siguientes: 18, 22, 30, 45, 54, 60, 73, 75, 86, 89, 90, 101, 102, 105, 106, 109, 
110, 120, 122, 124, 126, 129, 135, 137, 146, 147, 149, 150, 151, 153, 161, 165, 
169, 182, 183, 193, 195 y 225. Según un estudio realizado en Brasil [7], las re- 
glas de clase 3 pueden ser clasificadas en cuatro distintas subclases: Depósito 
Aleatorio (Declaración), representada por las siglas RD; Percolación Dirigi- 
da, representada por las siglas DP; Percolación Compacta Dirigida, de siglas 
CDP; y autómatas celulares Domany-Kinzel, de siglas DKCA y donde pue- 
den ser simétricos o asimétricos. Siendo que las reglas de clase 3 presentan 
comportamientos caóticos y pseudo-aleatorios, se eligieron cuatro reglas. La 
regla 30 perteneciente a la subcategoría RD; la regla 54 perteneciente a la 
subcategoría DKCA (asimétrica); la regla 73 perteneciente a la subcategoría 
CDP; y la regla 110 perteneciente a la subcategoría DP y DKCA (simétrica). 



4. Pseudo-aleatoriedad 

La necesidad de obtener números aleatorios y pseudo-aleatorios se plantea 
en muchas aplicaciones criptográficas, pues se emplean llaves que deben ser 
generadas con dichas características. Por ejemplo, para cantidades auxiliares 
usadas en generación de firmas digitales, ó para generar desafíos en auten- 
tificación de protocolos. El Instituto Nacional de Estándares y Tecnología 
(NIST) proporciona un conjunto de pruebas estadísticas de aleatoriedad y 
considera que estos procedimientos son útiles en la detección de desviacio- 
nes de una secuencia binaria en la aleatoriedad P]. Existen dos tipos básicos 
de generadores usados para producir secuencias aleatorias: Generadores de 
Números Aleatorios (RNGs) y Generadores de Números Pseudo-Aleatorios 
(PRNGs). Para aplicaciones criptográficas, ambos tipos de generadores pro- 
ducen un fiujo de ceros y unos que pueden ser divididos en sub-fiujos ó bloques 
de números aleatorios. Nuestro interés está en la revisión de un generador 
tipo PRNGs, en este caso, si la semilla (línea inicial) es desconocida, en el 
paso siguiente el número producido en la secuencia debe ser impredecible a 
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pesar de todo conocimiento de números aleatorios anteriores en la secuencia. 
Esta propiedad se conoce como imprevisibilidad siguiente, y es lo que se pre- 
sume que obtenemos mediante autómatas celulares de clase 3. El conjunto 
de pruebas de NIST es un paquete estadístico que consiste en 15 pruebas 
que se desarrollaron para probar la aleatoriedad de (arbitrariamente largas) 
secuencias binarias producidas por hardware y software basado en generado- 
res criptográficos de números aleatorios o pseudo-aleatorios. Dichas pruebas 
se enfocan en diversos tipos de no aleatoriedad que pueden existir en una 
secuencia. Las 15 puebas son: 

■ Prueba de frecuencia (Monobit). 

Esta prueba mide la proporción de ceros y unos de toda una se- 
cuencia. 

■ Prueba de frecuencia dentro de un bloque. 

Esta prueba mide la proporción de unos dentro de un bloque de M 
bits. 

■ Prueba de corridas. 

Esta prueba mide el total de corridas en una secuencia, donde una 
corrida es una secuencia interrumpida de bits idénticos. 

■ Prueba de la más larga corrida de unos en un bloque. 

Esta prueba mide la corrida más larga de unos dentro de un bloque 
de M bits. 

■ Prueba de rango de la matriz binaria. 

Esta prueba mide el rango de sub-matrices disjuntas de toda la 
secuencia. 

■ Prueba de la transformada discreta de Fourier (Espectral). 

Esta prueba mide las alturas de los picos en las transformadas dis- 
cretas de Fourier de las secuencias. 

■ Prueba de la no acumulación de coincidencia de plantilla. 

Esta prueba mide el número de ocurrencias de cadenas destino pre- 
especificadas. Una ventana de m bits es usada para buscar un patrón 
específico de m bits. 
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Prueba de acumulación de coincidencia de plantilla. 

Esta prueba también mide el número de ocurrencias de cadenas 
destino pre-especificadas. La diferencia con la prueba anterior reside en 
la acción realizada al encontrar un patrón. 

Prueba de Estadística Universal de Maurer. 

Esta prueba mide el número de bits entre los patrones de juego 
(una medida que está relacionada con la longitud de una secuencia 
comprimida) . 

Prueba de complejidad lineal. 

Esta prueba mide la longitud de un Registro de Desplazamiento con 
Retroalimentación Lineal (LFSR). Una baja longitud LFSR implica no 
aleatoriedad. 

Prueba de serie. 

Esta prueba mide la frecuencia de todos los posibles patrones de m 
bits acumulados a través de la secuencia completa. 

Prueba de entropía aproximada. 

Esta prueba tiene el mismo enfoque que la anterior, con el propósi- 
to de comparar la frecuencia de bloques acumulados de dos consecuti- 
vas/adyacentes longitudes (m y m + 1). 

Prueba de sumas acumulativas. 

Esta prueba mide la excursión máxima (desde cero) del paseo alea- 
torio definido por la suma acumulada de ajustados (-1, -|-1) dígitos en 
la secuencia. 

Prueba de excursiones aleatorias. 

Esta prueba mide el número de ciclos teniendo exactamente k visi- 
tas en una suma acumulativa de un paseo aleatorio. 

Prueba variante de excursiones aleatorias. 

Esta prueba mide el total de veces que un estado particular es 
visitado (es decir, se produce) en una suma acumulada de un paseo 
aleatorio. 
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5. Metodología 



Primeramente se recopiló información sobre las clases que propone Wol- 
fram para clasificar las reglas del autómata celular. Fue con esta recopilación, 
que se encontró que existían subcategorías propuestas dentro de la clase 3. Y, 
al encontrar estas subcategorías, se decidió reafizar pruebas de aleatoriedad 
a una regla por división, como se mencionó anteriormente. 



Cuadro 1: Resultados de las pruebas aplicadas a reglas representantes de 
cada una de las 4 clases de Wolfram (A significa que la prueba fue aprobada 
y R que fue reprobada). 



Prueba 


R30 


R54 


R73 


RUO 


Frecuencia (Monobit) 


A 


R 


R 


R 


Frecuencia dentro de un bloque 


A 


R 


R 


R 


Corridas 


R 


R 


R 


R 


Más larga corrida de unos en un bloque 


A 


R 


R 


R 


Rango de la matriz binaria 


A 


R 


A 


R 


Transformada discreta de Fourier (Espectral) 


R 


R 


R 


R 


No acumulación de coincidencia de plantilla 


A 


A 


A 


A 


Acumulación de coincidencia de plantilla 


A 


A 


R 


R 


Estadística Universal de Maurer 


A 


A 


R 


R 


Complejidad lineal 


A 


R 


A 


R 


Serie 


A 


R 


R 


R 


Entropía aproximada 


A 


R 


R 


R 


Sumas acumulativas 


A 


R 


R 


R 


Excursiones aleatorias 


A 


R 


R 


R 


Variante de excursiones aleatorias 


A 


R 


R 


R 



Por tanto, para cada una de las reglas elegidas, se generaron mediante 
Mathematica 1000 archivos con 10000 datos. Estos 10000 datos son confor- 
mados a partir de una 'cadena inicial de 100 caracteres, la cual es generada 
aleatoriamente y se compone únicamente de Os y Is. Después de generar los 
archivos para cada regla, estos se juntaron en un solo archivo, que posterior- 
mente se anahzaría mediante la Suite de Pruebas de la NIST. Al finalizar el 
análisis de cada archivo final (uno por regla), se obtuvo un archivo con los 
resultados del análisis, lo cual nos permite ver si la regla tiene o no carac- 
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terísticas que la avalen como pseudo-aleatorias o no. En el Cuadro 1, podemos 
ver una comparación de las reglas y su pase en cada una de las pruebas. 

Los resultados y calificaciones de la tabla se obtuvieron después de realizar 
varias veces el procedimiento de generación y prueba de datos y promediar 
los resultados por prueba estadística y por intento. 

6. Conclusiones 

Como podemos ver, la regla que más propiedades de pseudo-aleatoriedad 
presenta es la regla 30, por lo que podemos concluir que se puede considerar 
que es pseudo-aleatoria. Es importante notar que las dos pruebas que reprue- 
ba no se les considera que afecten a los resultados, puesto que se notó que 
sus reprobaciones son debido a que las corridas son consideradas perfectas, lo 
cual es poco probable en un generador de números pscudo-aleatorios. Por el 
contrario, la enorme falta de propiedades básicas de alcatoricdad en las otras 
reglas, nos permite pensar que es posible que solo las reglas de clase 3 que per- 
tenezcan a la subcategoría RD sean las que presenten pseudo-aleatoriedad. 
Se continúa realizando pruebas nuevamente, con reglas distintas a las elegi- 
das, para comprobar si es la subcategoría o si solamente fue una coincidencia 
entre las reglas elegidas de cada subcategoría que solo aquella pertenecien- 
te a la subcategoría RD sea pseudo-aleatoria. Consideramos que después de 
realizar estas pruebas se podría continuar con el trabajo enfocándose a la 
encriptación y recomendamos que se pruebe cada una de las reglas pseudo- 
aleatorias encontradas, como llave de un sistema simple de encriptación y, 
posteriormente, en uno más complejo para verificar el funcionamiento de las 
mismas como llaves y su utilidad. 
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